Skip to main content

Парсить данные

🔗 Оригинальная страница — Источник данного материала


Парсить данные

Описание

На вооружении ZennoPoster, имеется множество полезных инструментов, для анализа и сбора данных. Один из них «*Парсинг данных», в котором, без особых знаний, легким движением руки, с минимальным количеством кликов мыши, в считанное мгновение, можно настроить сбор интересующих вас данных, с текущей страницы.

image-20200820-091819

Как открыть окно Парсинг данных?

В контекстном меню окна браузера «Парсить данные»

image-20200824-111052

В контекстном меню «Дерева элементов» → пункт «Парсить данные»

Xowq8kfxhS

Детальный разбор панели Парсинг данных

image-20200820-092236

Данное окно, логически разделяется на 2-е части:

  1. Быстрый поиск
  2. Продвинутый поиск (имеющий дополнительные настройки)

Быстрый поиск

Сколько ищем?

Один или множество объектов.

Что брать?

  • Текст - видимое представление объекта.
  • Ссылки - данные в виде унифицированного указателя на ресурс.
  • Картинки - данные в виде пути до изображения (пример: https://zennolab.com/wp-content/themes/zenno/img/logo.png).
  • Другое - выбрать или указать, интересующий вас HTML-тег.
  • Только видимые элементы - парсить только те объекты, которые отображены (видимы) на текущей странице.
  • Искать во всех фреймах (от англ. frame) - самостоятельный, вложенный HTML-документ, в которым могут находиться нужные данные или наоборот.
  • Варианты - [ 1 ], [ 2 ], [ 3 ] и пр. автоматически предложенный вариант из возможно подходящих условий.

Продвинутый поиск

image-20210613-080734

+ Дополнительные настройки, применяются для более гибкого поиска.

  • Источник данных - структура данных в виде DOM или HTML (❗→ разница между DOM и Html).
  • Атрибут - свойство HTML-тега (элемента, объекта).
  • Строка поиска - в которой можно указать путь, который сообщает, к конкретно какому элементу (или элементам) веб-страницы необходимо обратиться, используя язык запросов: *XPath или *CSS Selector.
  • Фильтровать результаты - отобрать найденное по условию, но в результат поместить только то, что: Содержит, Не содержит, Regex (❗→ регулярное выражение).
  • Диапазон - ❗→ условие, по которому, можно отобрать данные из массива объектов.

Результаты

Окно, в котором наглядно видно предварительный результат данных, по выбранному условию.

Добавить в проект

После того, как вы выбрали, все необходимые условия и наглядно убедились в окне предварительного просмотра, необходимо нажать кнопку: Добавить в проект. После, в рабочей области проекта, появится действие «❗→ Парсить данные», в котором, необходимо указать, место для сохранения полученных данных.

Пример использования

Требование: Собрать адреса всех изображений активной страницы, текущего домена (в примере используется официальный сайт zennolab.com).

image-20200823-195304

Вуа-ля! Быстро и просто… Мы получили необходимый результат!

Полезные ссылки